数据脱敏的规则有哪些
数据脱敏的规则如下:
实现数据脱敏需求,并保证脱敏过程安全:随着互联网的普及、大数据价值的飙升,敏感信息泄漏事件已经充斥在日常生活中,企业是敏感信息的聚集地,也是数据泄漏的源头。数据共享、分析等才有价值,也就导致数据泄漏。目前脱敏是国家法律法规要求,也是企业核心数据不被泄漏的基本保护措施,在脱敏过程中也需要保证数据安全,防止脱敏过程中核心数据泄漏,实现合规。
保持原有数据特征:数据脱敏前后必须保证数据特征的保持,例如:身份证号码由十七位数字本体码和一位校验码组成,分别为区域地址码(6 位)、出生日期(8 位)、顺序码(3 位)和校验码(1 位)。那么身份证号码的脱敏规就需要保证脱敏后依旧保持这些特征信息。
脱敏后数据要和脱敏前数据保持一致性:在不同业务中,数据和数据之间具有一定的关联性,只有这样才能保障业务系统数据变更的持续一致性以及广义业务的持续一致性。例如:出生年月或年龄和出生日期之间的关系。同样,身份证信息脱敏后仍需要保证出生年月字段和身份证中包含的出生日期之间的一致性。
保持业务规则的关联性:保持数据业务规则的关联性是指数据脱敏时数据关联性以及业务语义等保持不变,其中数据关联性包括:主、外键关联性、关联字段的业务语义关联性等。特别是高度敏感的账户类主体数据往往会贯穿主体的所有关系和行为信息,因此需要特别注意保证所有相关主体信息的一致性。
可进行敏感数据自动发现,提升脱敏效率:互联网、数据共享等打破了数据孤岛问题,使数据更有价值,而海量的数据手动配置脱敏规则脱敏费时费力,效率低下,需实现敏感数据自动发现,建立敏感信息知识库,通过不断更新完善知识库和脱敏策略,整体提升脱敏效率。
多次脱敏之间的数据一致性:相同的数据进行多次脱敏,或者在不同的测试系统进行脱敏,需要确保每次脱敏的数据始终保持一致性,只有这样才能保障业务系统数据变更的持续一致性以及广义业务的持续一致性。